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摘要 : 

[目的 ] 报纸 一 直 是 传播 知识 的 重要 载体 ， 本 文 方法 为 实现 经 济 、 高 效 的 报纸 排版 工作 。 
[方法 ] 首先 根据 历史 优秀 版 面 训练 概率 模型 来 推断 电子 报 版 面 的 样式 ， 并 结合 固定 布局 约 
束 和 用 户 约束 保证 样式 有 效 ， 同 时 构建 美学 设计 原理 的 量化 方法 进一步 实现 样式 微调 。 
[结果 ] 通过 定性 和 定量 评估 ， 表 明 由 本 文 模型 推断 出 的 样式 参数 精确 度 恨 好 ， 且 满足 用 户 
一 定 的 需求 。 

[局 限 ] 本 文 方法 暂时 只 支持 单 页 电子 报 的 自动 生成 ， 然 而 报纸 排版 多 由 多 个 版 面 组 成 ， 故 
未 来 的 工作 需要 对 报纸 内 容 进行 分 页 操作 。 
[结论 ] 本 文 方法 可 以 自动 生成 满足 视觉 美观 性 、 层 次 性 和 可 读 性 的 报纸 。 
关键 词 ， 图 形 设计 “设计 原理 ”数据 驱动 方法 ”概率 分 布 ”约束 规划 
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Abstract: 
[Objective] Newspapers have always been an important carrier of knowledge 


dissemination. This method is to achieve economic and efficient newspaper 
typesettineg. 

[Methods] First, we infer the style of newspaper layout according to the 
historical excellent layouts training probability model, and combine the fixed 
layout constraints and user constraints to ensure that the style is effective 
At the same time, we build a quantitative method of aesthetic design principles 
to further realize style fine-tuning. 

[Results] Through qualitative and quantitative evaluation, it shows that the 
style parameters inferred from the model in this paper are accurate and meet 
the needs of users. 


[Limitations] The method only supports the automatic generation of single page 
electronic newspapers temporarily. However, newspaper layout is mostly composed 
of multiple pages, so the future work needs to page the newspaper content. 

[Conclusions] This method can automatically generate newspapers that meet the 
requirements of visual aesthetics, hierarchy and readability 
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随 着 信息 技术 的 飞速 发 展 以 及 互联 网 的 普及 ， 人 们 每 时 每 刻 都 在 创造 和 传 
播 着 海量 图 文 信息 ， 其 中 ， 电 子 报纸 就 是 一 种 以 数字 化 形式 进行 大 众 传播 信息 
的 重要 媒介 。 电 子 报纸 与 传统 印刷 报纸 版 面 风格 一 致 ， 其 版 式 结构 多 为 块 状 ， 
每 个 新 闻 块 通常 由 标题 、 图 片 、 正 文 、 广 告 等 设计 元 素 组 成 ， 这 些 设计 元 素 的 
样式 影响 着 整个 版 面 视觉 呈现 的 美观 程度 以 及 新 闻 信息 的 可 读 性 ， 如 何 将 符合 
美学 的 设计 原理 合理 有 效 的 融入 到 报纸 的 版 面 设计 中 成 为 报纸 排版 的 关键 环 
节 ， 这 里 用 到 的 美学 设计 原理 众多 "， 包 括 布局 规划 、 视 觉 传达 、 图 文平 衡 与 
对 比 、 版 面 对 齐 与 统一 等 等 大 量 专 业 知识 ， 专 业 的 报纸 设计 人 员 在 其 中 充当 着 
至 关 重 要 的 角色 ， 通 常 经 验 丰 富 的 专业 人 员 需 要 经 过 选 稿 、 制 作 新 闻 标 题 、 组 
织 与 设计 版 面 、 校 对 和 检查 等 一 系列 单元 组 成 的 互 有 联系 和 统一 的 复杂 过 程 ， 
该 过 程 周期 较 长 且 耗 时 耗 力 ， 故 排版 出 美观 优秀 的 电子 报 作 品 不 管 对 业余 用 户 
还 是 对 专业 设计 人 员 来 说 都 是 一 件 富有 挑战 的 事 。 

现 如 今 的 报纸 印刷 行业 大 都 使 用 排版 软件 进行 人 工 电 子 报 排版 ， 排 版 软件 
主要 为 方正 飞腾 、Adobe InDesign、CorelDRAW 等 ， 这 些 软件 提供 了 良好 的 用 
户 排 版 交互 界面 和 丰富 的 图 文 样式 素材 ， 同 时 软件 中 也 定义 了 图 文 结构 模板 库 
供用 户 选择 并 填充 内 容 。 然 而 ， 这 些 排版 软件 仍 需 人 工 进行 设计 排版 ， 无 法 达 
到 端 到 端的 电子 报 自动 生成 效果 。 由 于 数据 表示 需求 迅速 增加 以 及 人 工 排版 无 
法 批量 进行 电子 报 排版 设计 的 问题 ， 自 动 化 生成 电子 报 成 为 一 种 趋势 ， 虽 然 暂 
时 还 没有 电子 报 的 自动 排版 工具 出 现 ， 但 已 有 其 他 设计 方向 的 智能 排版 工具 


迎合 自动 化 排版 的 潮流 ， 如 Flipboard 可 以 将 一 些 社交 媒体 上 的 内 容 以 杂志 
的 形式 整合 在 一 个 页 面 上 供用 户 查 看 。 近 年 来 ， 一 些 研究 人 员 在 图 文 页 面 设计 
上 也 提出 了 一 些 有 效 可 行 的 自动 布局 计算 框架 ， 如 杂志 封面 、 海 报 的 自动 生成 


““， 这 些 方法 更 注重 于 设计 原理 的 制定 ， 而 不 是 图 片 本 身 ， 还 有 对 单个 设计 元 
素 进行 建 模 求解 ， 比 如 海报 文字 换行 ”、 字 体 匹配 ”、 图 片 色 彩 “ 等 。 

一 张 完整 的 新 闻 版 面 由 全 局 布局 结构 和 局 部 新 闻 面 板 样式 组 成 ， 一 个 新 闻 
面板 中 包含 标题 、 图 片 、 正 文 这 些 设计 元 素 ， 样 式 参数 则 是 用 于 描述 设计 元 素 
的 位 置 与 大 小 。 为 了 实现 电子 报 的 样式 智能 生成 与 微调 ， 需 要 解决 的 主要 问题 
有 以 下 方面 : 〈1) 数字 报 版 面 新 闻 篇 数 多 ， 每 篇 新 闻 的 重要 程度 不 同 ， 如 何 实 
现 版 面 样式 参数 的 差异 化 生成 ， 达 到 数字 报 版 面 排版 的 高 效 信息 传递 。 〈2) 新 
闻 版 面 内 容 丰 富 、 图 文 内 容 无 法 简单 地 基于 模板 进行 机 械 填 充 ， 如 何 实现 兼顾 
内 容 完整 性 和 美学 要 求 的 版 面 样式 微调 ， 达 到 数字 报 版 面 内 容 与 设计 风格 的 统 


为 了 解决 给 定 面板 内 图 文 样式 问题 ， 本 文 提出 了 一 种 基于 历史 优秀 版 面 的 
样式 智能 生成 和 微调 方法 ， 即 通过 电子 报 数据 集 学 习 一 个 用 于 推断 样式 参数 的 
概率 模型 ， 为 了 训练 概率 模型 ， 我 们 构建 了 一 个 包含 丰富 设计 元 素 信息 的 电子 
报 数据 库 ， 此 外 ， 我 们 还 结合 一 些 布局 约束 、 用 户 约束 以 及 美学 设计 原理 构建 
了 一 个 用 于 版 面 微调 的 布局 合成 规划 模型 。 通 过 我 们 的 方法 可 以 生成 内 容 与 风 
格 统一 ， 让 用 户 满意 的 版 面 样式 。 

综 上 所 述 ， 本 工作 的 主要 贡献 如 下 : 1、 我 们 贡献 了 一 个 细 粒 度 标签 化 的 电 
子 报 数据 集 ， 其 中 包含 丰富 的 设计 元 素 语 义 信 息 ， 我 们 还 展示 了 如 何 构建 从 图 
像 到 tex 代码 的 映射 。2、 我 们 引入 了 一 个 基于 历史 优秀 版 面 的 样式 自动 生成 与 
微调 方法 ， 该 方法 学 习 了 历史 优秀 报纸 版 面 的 设计 风格 ， 并 且 结 合用 户 约束 实 
现 样式 微调 ， 以 产生 高 质量 的 样式 设计 。3、 我 们 进一步 的 分 析 了 排版 结果 并 设 
计 对 比 实验 来 证 明 本 文 方法 的 有 效 性 。 


2 相关 工作 
2.1 基于 设计 规则 的 自动 布局 

在 传统 的 平面 设计 工作 中 , 工作 人 员 通 常会 根据 一 些 美学 设计 原理 和 先 验 知 
识 进行 图 文 排版 , 一 些 研 究 人 员 以 此 为 切入 点 , 在 完整 科学 的 美学 体系 中 提取 视 
觉 布局 的 关键 因素 来 量化 表示 图 文 的 关系 ， 从 而 达到 自动 化 布局 设计 的 目的 。 

在 杂志 海报 设计 上 ，Kuhna 等 ”使 用 了 基于 自 适 应 网 格 的 布局 ”进行 自动 数 
字 杂 志 生 成 , 该 论文 的 自动 排版 方法 主要 基于 图 像 重 要 度 区 域 来 识别 限定 文字 范 
,此 外 , Jahanian 等 人 "研究 了 正确 设计 一 个 良好 的 视觉 文本 布局 的 关键 概念 ， 
作者 介绍 了 设计 元 素 、 美 学 原则 以 及 色彩 方面 的 设计 目的 。0” Donovan P 等 人 ” 
”通过 优化 一 些 视觉 设计 原则 来 定义 对 应 的 能 量 函数 ， 从 而 实现 单 页 平面 设计 的 
自动 排版 。Yang X 等 ”提出 了 一 种 将 版 式 设 计 的 所 有 关键 要 素 整 合 在 一 起 的 计算 
框架 ， 该 计算 框架 实现 了 杂志 封面 的 排版 设计 。 以 上 方法 根据 设计 需求 从 不 同 角 
度 制 定 设计 规则 ， 这 些 规 则 在 杂志 封面 、 海 报 自动 化 布局 设计 中 起 着 核心 作用 ， 
然而 报纸 版 面 内 容 丰 富 , 排版 风格 整齐 统一 ， 图 文 内 容 无 法 简单 的 通过 设计 规则 
详细 的 描述 出 来 ,本文 方 法 从 真实 的 报纸 图 像 中 学 习 其 排版 风格 ,具有 可 扩展 性 
与 泛 化 性 。 
2.2 基于 数据 驱动 的 自动 布局 

数据 驱动 方法 主要 是 通过 给 定数 据 学 习 其 中 包含 的 设计 规则 , 预测 设计 元 素 
的 样式 参数 值 。Damera-V enkata 等 人 "利用 概率 文档 模型 (PDM) 来 生成 多 页 文 
档 布局 。Qiang YT 等 "推出 了 一 个 自动 生成 科技 论文 海报 的 计算 框架 ， 它 参考 
PDM 模型 提出 一 个 MAP 贝 叶 斯 网 络 推 理 框 架 来 整合 一 些 设计 原则 ， 以 此 来 推断 每 
个 面板 的 属性 与 图 片 的 排列 。You WT 等 人 "在 自动 合成 广告 中 引入 了 捕捉 训练 
图 像 的 风格 概率 模型 , 该 模型 结合 了 图 形 元 素 特征 来 预测 目标 上 下 文中 的 设计 性 
能 。Zhang Y K 等 人 采用 了 布局 风格 学 习 、 插 值 和 迁移 相 结合 的 方法 实现 自动 
化 的 横幅 设计 。Lee H Y2 等 人 结合 用 户 约束 搭建 了 一 个 图 像 布局 生成 神经 网 络 。 
以 上 这 些 方法 更 专注 于 对 海报 、 广 告 等 作品 整体 布局 框架 的 设计 ， 然 而 我 们 需要 
根据 报纸 的 排版 风格 设计 新 闻 面 板 内 部 布局 的 关键 特征 。 最 近 几 年 ， 生 成 对 抗 网 
络 (GAN) 也 流行 于 图 像 生 成 领域 “， 比 如 文本 到 图 像 的 合成 和 艺术 文字 logo 
布局 设计 ”“， 此外, 文献 [22] 利 用 生成 对 抗 网 络 学 习 出 面向 平面 设计 布局 的 生成 
模型 。 虽 然 GAN 在 图 像 风 格 迁移 、 网 像 补 全 等 方面 表现 良好 ， 但 它 可 解释 性 、 可 
调控 性 较 差 ， 且 难以 找到 合适 的 数据 集 进行 训练 ， 故 我 们 暂时 不 考虑 使 用 GAN。 

我 们 的 方法 受到 了 文献 [15] 的 启发 , 即 通 过 数据 本 身 的 分 布 特点 建立 样式 参 
数 的 概率 推断 模型 ， 与 文献 [15] 不 同 的 是 ， 本 文 是 对 于 多 个 新 闻 面 板 进行 标题 、 
图 片 、 正 文 样式 的 选择 ,为 了 实现 面板 样式 的 差异 化 生成 与 内 容 完整 性 ,我 们 结 
合 面板 分 制 的 空间 约束 条 件 来 推断 样式 参数 的 概率 分 布 并 保证 内 容 填 充 均 匀 不 
洲 出 。 
3 数据 集 的 介绍 

在 本 节 中 ， 我 们 将 介绍 如 何 获得 电子 报 数据 集 ， 同 时 说 明 注释 的 统一 规则 ， 
并 根据 新 闻 块 内 各 设计 元 素 的 特点 用 tex 语言 进行 描述 , 图 1 显示 了 创建 电子 报 
数据 集 的 工作 流程 。 


es 


0 


DO 


2 
ee Ee 


CN 
~ 
go 
Cy 
Py 
WY 


CN 


Lb 


选择 预 训 
练 模型 


建立 样式 类 别 标签 
到 tex 代 码 的 映射 


< 
选 图 像 


。 1 1 | 大 和 项目 快 推进 夯实 举措 强 支撑 、 机 1 
picture 1 1 > 类 别 标签 ! 
1 
| J 
1 
11 
11 


I pd 

| ep Wo A EPa7rY 

1 本 li 
下 下 

1 上 


.G0 title 


1 

I 

EE SE 一 other _ {\centering\heiti{ \fontsize | 

L 济 .- picture 1 {21}{0}\selectfont \par}} 1 


图 1 建立 电子 报 数据 集 流 程 图 


3.1 图 像 获取 

为 了 完成 电子 报 自动 生成 的 任务 , 我 们 需要 一 个 能 够 清楚 描述 报纸 设计 元 素 
大 小 和 位 置 的 电子 报 数据 集 ， 然 而 现 有 的 一 些 公 开 的 杂志 、 海 报 等 数据 集 的 布局 
风格 与 报纸 相差 较 大 ， 且 包含 的 样式 特征 种 类 不 丰富 ,所 以 我 们 需要 基于 优秀 的 
人 工 排版 作品 构建 一 个 更 加 细 粒 度 的 电子 报 数据 库 。 

我 们 从 报刊 《今日 金东 》 的 数据 库 中 获取 了 大 量 新 闻 版 面 图 像 以 及 对 应 的 新 
闻 内 容 原始 素材 〈 如 标题 内 容 、 正 文 内 容 、 图 片 等 ) 。《 今 日 金东 》 是 人 工 高 质 
量 的 排版 作品 ， 它 包含 丰富 的 符合 大 众 审 美的 版 面 特征 ， 这 些 版 面 涵盖 了 要 闻 、 
娱乐 、 人 物 、 人 文 等 不 同类 型 的 版 块 ， 其 中 头 版 的 排版 风格 与 其 他 种 类 版 面相 比 
而 言 更 为 规整 、 稳 定 ， 它 的 整体 布局 通常 由 规则 的 矩形 排列 组 成 ,这 有 利于 编写 
通用 的 tex 模板 并 在 latex 排版 系统 中 编译 实现 , 而 对 于 那些 不 规则 元 素 较 多 的 
版 面 ， 我 们 需要 进行 手动 移 除 。 在 移 除 所 有 不 规则 布局 图 片 后 ， 我 们 得 到 了 235 
张 电 子 报 图 片 ，958 个 新 闻 面 板 。 
3.2 手工 注释 与 模型 微调 训练 

在 本 工作 中 ,我 们 借助 百度 开发 的 PPOCRLabe 1 工具 中 进行 标注 ， 每 个 元 素 
都 由 一 个 矩形 边界 框 标 记 。 标 签 主要 包含 四 种 : 标题 、 文 本 、 文 章 图 片 、 报 花 图 
片 。 我 们 将 标题 元 素 与 文本 元 素 区 分 开 来 ,因为 标题 元 素 在 报纸 设计 中 起 着 关键 
作用 ， 将 报 花 图 片 与 文章 图 片 分 开 来 则 是 因为 文章 图 片 是 属于 固定 的 新 闻 内 容 ， 
而 报 花 图 片 则 是 报纸 版 面 需求 。 其 中 , 报 花 图 片 一 般 为 广告 、 报头 、 报 尾 、 启事 、 
署名 之 类 与 新 闻 文 章 本 身 并 无 太 大 关系 ， 主 要 用 于 填充 留 白 ， 美 化 版 面 。 总 之 ， 
这 些 标签 描述 了 电子 报 版 面 中 各 个 设计 元 素 的 分 布 情况 , 我 们 可 以 从 中 分 析出 它 
们 的 大 小 与 位 置 ， 为 下 文 的 概率 模型 的 学 习 提 供 详细 的 特征 数据 。 

为 了 统一 注释 规则 并 保证 注释 的 质量 ， 我 们 为 标注 者 进行 15 分 钟 的 培训 。 
由 于 图 片 数 量 过 多 ,如 果 全 部 进行 人 工 注 释 耗 时 耗 力 ， 所 以 我 们 首先 标注 了 一 小 
部 分 数据 ,图 2 显示 了 手动 注释 设计 元 素 的 一 个 例子 , 之 后 通过 这 些 标注 数据 在 
PaddleDetection 工具 中 训练 了 一 个 cascade_rcnn 网 络 凶 来 自动 分 割 其 他 电子 
报 版 面 。 该 网 络 的 平均 精度 为 0.814， 我 们 邀请 注释 人 员 对 识别 结果 进行 评判 ， 
大 家 对 最 后 的 结果 一 致 认同 。 
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图 2 电子 报 注释 示例 
该 手工 标注 与 模型 微调 训练 的 方法 实现 自动 化 的 批量 特征 提取 , 可 以 扩展 到 
多 种 不 同类 型 数字 报 的 特征 提取 中 ,具有 民 好 的 可 扩展 性 。 同时 基于 大 量 历史 优 


秀 版 面 可 以 丰富 数据 集 的 特征 信息 ， 从 而 提高 版 面 自动 排版 的 质量 。 
3.3 建立 图 像 到 tex 代码 的 映射 

我 们 提出 的 电子 报 自动 布局 方法 主要 基于 1atex 排版 系统 进行 文档 生成 , 即 
根据 系统 推荐 与 用 户 需 求 自动 生成 对 应 的 tex 代码 从 而 编译 生成 报纸 文档 的 “外 
观 ”。 tex 由 一 些 很 原始 的 命令 组 成 , 里面 有 很 多 参数 可 以 设置 , 它们 可 以 完成 简 
单 的 程序 设计 功能 和 排版 操作 , 所 以 我 们 需要 根据 图 像 特征 制定 新 闻 面 板 样 式 结 
构 与 tex 语句 的 映射 ， 建 立 图 像 到 代码 的 映射 模型 。 

为 了 建立 映射 模型 , 我 们 以 单独 的 新 闻 面 板 为 单位 , 根据 版 面 识别 模 型 获得 
的 边界 框 坐标 、 大 小 信息 得 到 标题 、 图 片 、 正 文 的 位 置 分 布 并 以 不 同 的 类 别 标签 
来 表示 ，3.1 节 对 电子 报 样 式 种 类 进行 了 具体 描述 (比如 
horizontaltitle_nopic_nocol 表示 横 标 题 无 图 不 分 栏 的 图 文 结构 样式 )， 由 此 
为 每 个 标签 分 配对 应 的 tex 模板 代码 , 即 制定 一 套图 像 特征 到 tex 代码 的 映射 规 
范 来 实现 代码 的 自动 生成 , 它 可 以 根据 模板 种 类 生成 模板 代码 ,该 映射 模型 的 最 
大 优势 就 是 将 电子 报 图 像 与 tex 代码 连接 起 来 , 从 而 可 以 基于 大 量 历 史 优 秀 版 面 
数据 ， 自 动 生成 丰富 的 样式 模板 库 。 该 手工 标注 与 模型 微调 训练 的 方法 实现 自动 
化 的 批量 特征 提取 ,可 以 扩展 到 多 种 不 同类 型 数字 报 的 特征 提取 中 ,具有 良好 的 
可 扩展 性 。 同时 基于 大 量 历史 优秀 版 面 可 以 丰富 数据 集 的 特征 信息 ， 从 而 提高 版 
面 自动 排版 的 质量 。 
4 方法 

为 了 获得 合适 的 样式 参数 来 生成 可 读 性 强 且 美观 的 数字 报 ， 我 们 提出 了 一 
个 基于 历史 优秀 版 面 的 样式 自动 生成 与 微调 方法 。 在 本 节 中 ， 我 们 详细 描述 了 
该 计算 方法 的 具体 步 又， 如 图 3 所 示 ， 计 算 方法 总 体 有 以 下 三 个 步骤 ， 即 样式 
结构 推 新 、 样 式 参数 推 新 、 布 局 微调 与 生成 。(1) 在 4.1 节 中 ， 我 们 从 历史 优 
秀 电子 报 版 面 中 提取 出 单个 新 闻 面 板 中 样式 结构 的 种 类 ，(2) 然后 将 其 作为 类 
别 标签 ， 运 用 到 4. 2 节 的 图 文 样 式 结构 分 类 模型 的 学 习 中 ， 此 外 ， 对 于 栏 数 、 
标题 字号 我 们 设计 概率 模型 用 来 推断 这 些 参数 的 候选 集合 。(3) 最 后 ， 我 们 在 
4. 3 节 中 构建 一 个 基于 约束 的 布局 规划 模型 ， 并 结合 美学 设计 原理 获取 最 优 的 
样式 参数 值 进行 布局 合成 。 
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图 3 计算 方法 框架 图 


4.1 样式 结构 分 类 

对 于 一 张 完整 的 报纸 版 面 ,我 们 对 新 闻 页 面 元 素 进行 结构 化 表达 , 把 围绕 茶 
个 主题 的 图 文 块 抽象 为 矩形 块 ， 称 为 新 闻 面 板 ， 每 个 新 闻 面 板 均 包 含 一 定数 量 的 
设计 元 素 。 在 学 习 获 得 样式 参数 之 前 , 我 们 决定 先 将 收集 到 的 电子 报 图 片 作 为 参 
考 标准 ， 进 一 步 提取 出 电子 报 单个 新 闻 面 板 中 所 有 设计 元 素 的 种 类 。 
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图 4 电子 报 样式 示例 

通过 初步 调查 , 我 们 收集 了 电子 报 常 用 的 图 文 分 布 结构 ， 电 子 报 的 图 文 结构 
分 类 可 以 理解 为 对 标题 、 正 文 、 图 片 这 三 个 设计 元 素 位 置 结构 的 划分 。 标 题 可 以 
分 为 竖 标 题 和 横 标题 (图 4(a)、 (b)) ， 正 文 可 以 分 为 不 分 栏 文章 和 分 栏 文章 (图 
4(d)、(f 们 ) ， 图 片 的 划分 相对 与 标题 、 正 文 来 说 较为 复杂 ， 在 这 里 我 们 按照 单个 
图 片区 域 与 正文 文字 的 相对 位 置 划分 出 了 三 大 类 : 横 癌 排列 、 纵 同 排 列 、 内 蕉 型 
排列 。 其 中 : 

@ 横 癌 排列 又 可 以 分 为 同上 型 横 排 和 向 下 型 横 排 ， 如 图 4(d) 、(〈e) 

@ 纵向 排列 分 为 左右 两 种 方向 排列 ， 如 图 4(b) 、(c) 

@ 内 骸 型 排列 多 出 现在 分 栏 文章 中 ， 即 在 栏 中 插入 图 片 ， 如 图 4(f) ， 在 不 

分 栏 文章 中 的 内 骨 型 图 片 则 是 图 文 环绕 样式 。 多 个 图 片区 域 的 样式 则 是 
以 上 三 种 类 型 排列 组 合 形成 。 

如 果 要 对 一 篇 文章 的 图 文 结构 设置 种 类 名 称 ， 可 以 根据 标题 、 图 片 、 正 文 的 
离散 参数 值 进行 排列 组 合 ， 获 得 对 应 的 样式 种 类 名 称 ,比如 图 4(a) 用 
verticalwraptitle nopic nocol 表 示 ， 4(b) 和 4(c) 使 用 
horizontaltitle rightpic nocol、horizontaltitle leftpic nocol 表示 。 这 
里 的 每 个 下 划 线 前 的 字母 分 别 对 应 标题 样式 、 图 片 位 置 、 正 文 分 栏 情 况 的 描述 。 

最 后 ， 我 们 将 以 上 的 样式 参数 与 新 闻 内 容 参 数 进行 表征 。 表 1、 表 2 显示 了 
学 习 概 率 模型 需要 用 到 的 电子 报 特征 信息 : 


表 1 新 闻 版 面 参数 


参数 名 称 描述 
新 闻 面 板 位置 (p,, p,) 及 大 小 (p,,， 新 闻 面 板 位 置 为 新 闻 面 板 左下 角 坐标 
万 ) ) 
标题 方向 1， 及 大 小 标题 方向 分 为 横 标题 和 竖 标题 , 大 小 为 标 
题字 号 大 小 
图 片 位 置 8 ,及 大 小 (g,，, g;) 图 片 位 置 由 离散 变量 定义 
正文 是 否 分 栏 z 及 栏 数 c， 为 布尔 值 ， 表 示 正 文 分 栏 情况 
表 2 新 闻 内 容 参 数 
参数 名 称 描述 
标题 字数 1,、 下 文字数， 单 篇 文章 的 主 标 是 字数、 正文 字数 
文字 比例 1 单 篇 文章 中 字数 占 整 个 版 面 字数 的 比例 
图 片 数量 g， 单 篇 文章 中 图 片 的 数量 


4.2 样式 参数 概率 推断 模型 

在 开始 设计 一 张 报纸 时 , 需要 将 报纸 版 面 按 照 新 闻 文 章 数量 分 割 成 多 个 面板 ， 
对 于 面板 参数 的 初始 值 ， 我 们 使 用 本 项 目 另 一 工作 版 面 自动 布局 方法 获取 ， 该 方 
法 生成 的 布局 数据 学 习 了 历史 数据 报 的 拓扑 结构 ， 我 们 将 它 作为 初始 布局 数据 ， 
并 固定 每 个 新 闻 面 板 的 分 制 比例 (因为 初始 布局 数据 学 习 了 历史 版 面 的 分 割 比 例 ， 
一 般 根据 基本 栏 宽 分 割 ), 即 保 留 新 闻 面 板 的 x 轴 位 置 (p ) 和 宽度 (p, )， 之 后 通 
过 调整 新 闻 面 板 y 轴 位 置 (p,) 和 高 度 (p,) 避 免 块 间 重 车 。 

己 知 一 个 新 闻 面 板 的 初始 为 C1 ( 即 p,, p,, p,，p,)， 同时 我 们 将 第 3. 1 节 划 
分 出 的 图 文 样式 结构 类 别 作为 类 别 标签 , 训练 一 个 基于 朴素 贝 叶 斯 的 样式 结构 分 
类 器 ， 当 给 定 一 组 面板 参数 值 后 ， 该 分 类 器 可 以 预测 图 文 结构 ， 即 获取 标题 、 图 
片 、 正 文 这 些 设 计 元 素 的 离散 型 属性 ,包含 标题 的 位 置 y、 图 片 的 位 置 g ，、 正 文 
是 否 分 栏 ic 这 三 种 描述 图 文 样式 结构 的 离散 变量 。 

朴素 贝 叶 斯 分 类 器 是 一 种 经 典 、 稳 定 的 机 器 学 习 算 法 ， 对 计算 性 能 没有 过 高 
要 求 且 分 类 效果 表现 良好 , 它 主要 是 利用 贝 叶 斯 定理 计算 未 知 属性 在 已 知 条 件 下 
的 条 件 概率 。 由 此 我 们 定义 了 对 于 一 个 面板 Pi 的 样式 结构 Y 的 联合 概率 : 
P(C1|Y)P(Y) (1) 

P(C1) 

我 们 使 用 前 面 建立 的 样式 特征 数据 库 进 行 分 类 器 的 训练 , 这 里 采用 了 一 个 假 
设 : 已 知 条 件 Cl 中 的 特征 是 条 件 独立 的 ， 该 假设 足以 完成 最 终 的 分 类 任务 。 

在 获得 面板 Pi 内 的 样式 结构 后 ， 我 们 将 注意 力 转 向 每 个 面板 内 样式 结构 的 
参数 设置 。 考 虑 到 报纸 的 视觉 美观 程度 以 及 信息 可 读 性 , 需要 合理 安排 每 个 面板 
内 标题 字号 的 大 小 (7,)、 正 文 栏 数 (c,) 以 及 图 片 大 小 (8g,，, g,)，, 其 中 图 片 的 宽度 
(g,) 和 图 文 样式 结构 Y 有 很 大 的 关系 ， 因 为 在 典型 的 新 闻 布 局 中 ， 面 板 中 图 片 
的 宽度 跨越 整数 栏 ， 通 常 都 会 有 固定 的 宽度 ， 故 图 片 宽度 不 需要 参数 化 ， 本 文 图 
片 高 度 初始 值 按 照 原 始 图 片 的 比例 计算 获得 。 但 是 对 于 后 面 样式 微调 时 插入 报 花 
图 片 这 种 特殊 情况 , 我 们 可 以 根据 留 白 面积 适当 的 伸缩 图 片 高 度 以 适应 面板 内 的 
空间 布局 。 

为 了 估计 标题 字号 (1, )、 正 文 栏 数 (c,) 这 些 参数 的 概率 分 布 ， 我 们 采用 
核 密度 估计 方法 (KDA) 将 栏 数 、 标 题字 号 的 离散 分 布 转化 为 连续 分 布 : 


P(Y| CD = 


1 n Xx 
一 一 2 
Pi et Ee (2) 


1 15 
Ue 2 (3) 

其 中 x= Ge x x3,.…)， 这 是 样式 参数 值 集合 ， xiE[x—h,x+h], 有 为 带宽 ， 这 里 
使 用 网 格 搜索 法 寻找 最 优 带宽 ， 核 函数 KG) 使 用 高 斯 核 函 数 ， 因 为 高 斯 核 函数 的 
形状 更 适合 描述 本 文 样式 特征 数据 库 中 变量 的 分 布 情况 , 图 5 显示 了 部 分 聚 类 结 
果 中 标题 字号 的 分 布 情况 。 
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图 5 部 分 谷类 结果 中 标题 字号 密度 分 布 直方 图 和 核 密度 估计 曲线 
栏 式 是 组 成 报纸 版 面 的 基本 形式 , 一 般 将 常用 的 栏 式 称 为 基本 栏 。 一 张 报纸 
的 基本 栏 栏 宽 往往 是 统一 的 ,但 也 允许 略微 改动 ， 栏 宽 的 长 度 通 常 以 一 栏 中 的 单 
行 字数 表示 ， 所 以 当 对 栏 数 进 行 估计 时 ,我 们 把 它 转化 为 对 于 单行 字数 的 条 件 概 
率 计算 ; 


本 天 ,二 Gao(Gn= 山 (4) 
Ples|p,)=f,(c,) (5) 

其 中 ,为 一 栏 中 的 单行 字数 ，p 为 面板 宽度 , c,, 为 栏 间 距 , m, 为 正文 字号 ， 
考虑 到 我 们 数据 集中 正文 字号 都 是 固定 的 , 所 以 将 正文 字号 看 作 全 局 变量 ， 可 以 
由 用 户 预 设 定 或 系统 默认 值 获得 ，c, 为 栏 数 , 其 取 值 范围 为 [1, 7], 最 后 选择 最 大 
概率 对 应 的 栏 数 。 

标题 是 报纸 样式 布局 中 的 一 个 重要 的 部 分 ,影响 标题 变化 的 因素 较 多 ,我 们 
选择 面板 属性 {p,, p,, p,,，p,} 和 新 闻 内 容 属性 集合 {1,, m,, 1,，g,} 作 为 已 知 特 
征 C2， 然 后 将 标题 字号 (1, ) 和 样式 结构 类 别 (Y ) 作为 未 知 特征 。 为 了 获得 相 
似 特征 面板 下 的 标题 字号 分 布 情况 ， 对 于 给 定 面板 Pi 的 标题 字号 ， 我 们 首先 根 
据 已 知 条 件 C2 使 用 k 均值 聚 类 (k=13) 划分 类 别 ， 之 后 再 对 聚 类 后 的 每 个 类 中 的 
标题 字号 (1, ) 进行 联合 概率 分 布 计算 : 

1=arg min||C2—p, (6) 
PGs|D=f ,417 POY|CD (7) 

其 中 1 为 该 面板 聚 类 后 的 类 别 号 ，% ;为 第 j 个 聚 类 中 心 (j=1,…, k)，1, 为 标 
题字 号 ，C2 为 已 知 条 件 ， 了 7 为 图 文 样式 类 别 标签 。 

最 后 采样 高 概率 参数 值 获取 图 文 样式 结构 、 栏 数 、 标 题字 号 的 候选 集合 。 
4.3 基于 约束 的 布局 合成 规划 模型 
前 面 都 是 关于 报纸 单个 面板 中 样式 参数 候选 集合 的 局 部 计算 , 而 最 后 布局 合 
成 需要 着 眼 于 全 局 内 容 的 组 成 , 所 以 从 样式 候选 集合 中 找到 既 满足 布局 结构 约束 
又 满足 美学 设计 原理 的 样式 参数 至 关 重 要 , 我 们 也 将 获取 最 优化 样式 参数 的 过 程 
称 为 样式 微调 ,为 了 解决 这 一 问题 我 们 提出 了 一 个 基于 约束 的 布局 合成 规划 模型 ， 


该 模型 需要 设计 约束 条 件 和 目标 优化 函数 。 


图 6 布局 结构 示例 

首先 ， 给 定 一 组 描述 报纸 整体 布局 结构 的 数据 (由 p,, p,, p,, p; 组 成 且 不 
包含 报头 信息 )， 我 们 对 这 些 数据 进行 分 析 并 提炼 出 其 中 包含 的 布局 约束 ， 即 将 
面板 宽度 p, 和 p, 化 标 作为 硬 约束 , 但 不 限制 面板 的 高 度 m, 与 p, 坐 标 , 这 些 约束 
会 以 线性 表达 式 的 形式 通过 解析 程序 自动 生成 , 图 6 显示 了 一 个 布局 示例 在 坐标 
系 中 的 位 置 表示 ， 这 里 的 长 度 度量 单位 为 百分比 。 

之 后 我 们 加 入 对 标题 的 约束 条 件 , 很 多 时 候 人 们 对 一 张 报纸 版 面 的 初始 印象 
就 来 自 各 新 闻 块 标题 之 间 的 大 小 关系 ,标题 是 否 错落 有 致 、 层 次 分 明 影 响 着 报纸 
的 美观 程度 与 可 读 性 。 文 章 权重 表现 了 文章 的 重要 性 与 层次 性 ， 所 以 我 们 需要 根 
据 文章 权重 对 每 个 面板 标题 的 大 小 进行 有 序 排列 。 这 里 的 文章 权重 可 以 通过 用 户 
定义 设置 获取 ,也 可 以 从 每 个 面板 标题 字号 聚 类 结果 的 平均 值 中 推断 获得 ， 此 
外 ,我 们 加 入 了 标题 字号 压缩 系数 来 限制 标题 行 数 不 超过 两 行 ， 该 压缩 系数 可 以 
改变 字 的 长 宽 比 例 ,， 它 的 靖 值 由 先 验 知识 获取 。 总 之 ， 一 张 报纸 中 所 有 面板 的 标 
题字 号 需要 按照 文章 权重 从 候选 集合 中 选择 逐次 递减 的 字号 组 合 。 算 法 1 总 结 了 
标题 字号 组 合 的 计算 过 程 。 
算法 1 标题 字号 组 合 
输入 每 篇 新 闻 内 容 参数 值 ; 
输出 ”res 存放 以 面板 为 单位 且 按 照 权 重 顺序 的 字号 排列 组 合 的 结果 

: 初始 化 : res, temp 为 空 数组 


1 

2: for each pi in P do 

3: ”上 归 一 化 输入 特征 ; 

4: ”计算 面板 pi 特征 到 K 个 聚 类 中 心 的 距离 di;; 
5: ci<—argmin (di, ds, ,do ; 
6 

“ 

8 


dict 存储 类 别 ci 中 的 高 概率 参数 值 ; 


: weights<—sort by mean fontsize of dict ; 


: call page backtrack (0, dict, weights, res) ; 
9: 过 程 page backtrack(index, dict, weights, res); 
10: if temp 按 大 小 排序 后 与 weights 相同 then: 
11: add temp to res; 
12: for each index in dict; 
13: add index to temp; 
14: call page backtrack (index+l, dict, weights, res); 
15: delete index from temp; 
每 个 面板 的 留 白 空间 也 是 需要 合理 分 配 的 , 为 了 让 版 面 留 白 均 匀 , 对 于 留 白 
过 多 的 情况 我 们 可 以 加 入 报 花 元 素来 填充 留 白 区 域 。 对 于 报 花 图 片 的 选择 ,我 们 
设计 了 用 于 报 花 选择 的 用 户 交 互 界面 ， 如 图 7 所 示 , 用 户 可 以 根据 需求 选择 相应 
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的 报 花 插入 指定 位 置 。 若 用 户 没 有 选择 报 花 的 插入 ， 系 统 也 会 根据 留 白 大 小 推荐 
合适 比例 的 报 花 进行 插入 《 即 在 已 知 留 白 宽度 的 情况 下 通过 最 近邻 (knn) 算法 从 
报 花 库 中 找到 大 小 最 合适 的 报 花 插入 对 应 的 留 白 区 域 中 )。 


新 闻 篇 幅 i 
是否 插入 报 花 得 站) 还 二 要 更 加 
选择 报 花 eR 更 后 下 ¥ 
淄 
文章 底部 2 
报 花 位 置 文章 顶部 i 
栏 顶部 H 
廊 部 
报 花 宽度 E 
aa 
报 花 高 度 
立即 创建 


图 7 报 花 图 片 用 户 交 互 界 面 
在 考虑 好 各 个 设计 元 素 的 限制 条 件 后 我 们 进行 条 件 整合 , 与 文献 L24] 中 计算 
面板 面积 相似 ， 为 了 防止 面板 内 容 溢出 、 留 白面 积 过 多 以 及 留 白 不 均匀 的 情况 ， 
我 们 需要 计算 参数 候选 集合 中 各 个 参数 值 经 过 排列 组 合 后 对 应 的 面板 内 容 面 积 ， 


板 内 容 的 实际 面积 {sc0,.., sc. Sc,),i=1...n， 这 里 需要 设置 面板 面积 大 于 面板 内 容 
面积 的 约束 ， 面 板 留 白 面积 s; 则 定义 为 这 两 组 面积 的 差 值 ， 同 时 ， 从 报 花 库 中 选 
择 出 来 的 报 花 图片 也 需要 根据 实际 的 留 白面 积 相应 的 调整 其 高 度 。 

由 以 上 条 件 定义 目标 函数 为 : 

f =min(a ?> iS;+tasmax( Si/p,s— gnD)) (8) 

其 中 ，7; 为 留 白 面积 缩放 因子 ，s; 为 第 i 个 面板 的 留 白 面积 ，p, 是 第 i 个 
面板 的 宽度 ，g, 为 该 面板 对 应 的 报 花 图 片 高 度 , 第 一 项 js; 定义 为 最 小 化 额外 留 
白面 积 ， 第 二 项 用 于 衡量 报 花 图 片 纵横 比 的 伸缩 变化 程度 ，max|sy/p -sg ,| 定义 
为 对 于 一 个 报纸 版 面 的 所 有 面板 中 ， 其 留 白 空间 高 度 与 报 花 图 片 初 始 高 度 〈 由 报 
花 图 片 原始 比例 计算 获得 ) 之 间 的 最 大 差 值 。 根 据 先 验 知识 可 得 留 白面 积 一 般 会 
在 页 面 底 端 , 所 以 在 底 端 面板 的 缩放 因子 4; 普 裔 设置 较 小 。 设置 好 以 上 这 些 条 件 
后 ， 我 们 采用 了 谷歌 开发 的 组 合 优化 工具 ortools“ 进 行 约束 优化 问题 的 求解 。 

最 后 选择 使 目标 函数 最 小 的 一 组 样式 参数 进行 布局 合成 , 在 布局 合成 过 程 中 
我 们 还 使 用 美学 规则 或 是 先 验 知识 进一步 完善 布局 ， 比 如 重要 性 原则 、 对 齐 对 称 
原则 、 留 白 原 则 等 。 


5 实验 结果 
5.1 模型 有 效 性 评估 
由 于 现 有 的 相关 研究 中 缺少 可 直接 用 于 数字 报 样式 生成 和 微调 的 可 参照 对 


比方 法 ， 故 采用 其 他 典型 的 分 类 模型 和 回归 模型 与 本 文 方法 进行 对 比 实 验 , 用 来 
证 明 本 文 方法 的 有 效 性 。 

对 于 样式 结构 种 类 的 推断 ， 我 们 使 用 了 新 闻 面 板 〈 p,, p,, p,，p, ) 特征 作 
为 已 知 条 件 ， 并 选择 了 三 种 比较 典型 的 概率 分 类 模型 进行 学 习 。 其 中 准确 率 
Caccuracy) 衡量 了 测试 样本 中 模型 推断 结果 的 正确 程度 ,， 它 可 以 用 于 评估 分 类 
结果 的 有 效 性 ， 准 确 率 计 算 如 下 : 


accuracy = > 全 (9) 
1i=1 


n 


1ifv= y 
TD (10) 


0，otherwise 


其 中 ，y 表示 原始 面板 的 真实 样式 结构 种 类 ，y 表示 由 分 类 模型 推断 出 来 的 
样式 结构 种 类 。 五 (y,y) 为 分 类 正确 的 结果 赋值 1， 为 分 类 错误 的 结果 赋值 0。 
表 3 数据 集中 各 类 样式 数量 
数据 集 标题 图 片 正文 
横 标题 | 竖 标 题 | 横向 分 割 | 纵向 分 割 | 峙 入 式 | 分 栏 | 不 分 栏 
训练 集 405 116 48 61 21 293 228 
测试 集 220 58 27 35 14 154 124 


在 数据 集 的 划分 上 , 本 文 使 用 k 折 交 叉 验 证 的 方法 选择 训练 集 和 验证 集 ， 表 


3 详细 的 描 


述 了 训练 集 和 测试 集中 标题 、 图 片 、 正 文 的 不 同样 式 对 应 的 数 


量 , 可 


以 看 到 图 片 数据 相对 于 标题 、 


正文 来 说 占 比 较 少 , 这 是 因为 通常 一 张 完 整 的 报纸 


版 面 中 无 图 


文章 占 比 较 多 。 由 于 图 片 类 别 数据 不 平衡 ， 故 本 文 分 别 训练 了 有 图 文 


章 分 类 器 与 无 图 文章 分 类 器 ， 最 后 联合 这 些 分 类 器 进行 分 类 。 
表 4 样式 参数 分 类 结 


方法 标题 方向 图 片 位 置 分 栏 情 况 
朴素 贝 叶 斯 0. 98 0. 82 0. 95 
多 元 逻辑 回归 0. 97 0.78 0. 96 
文 持 向 量 机 0. 98 0. 79 0. 95 


表 4 显示 了 样式 结构 分 类 标签 Y 代表 的 三 个 离散 参数 在 不 同 分 类 器 上 的 准 
确 率 ,说 明了 我 们 的 电子 报 数据 集 在 分 类 器 上 表现 良好 ,在 标题 方向 和 分 栏 情况 
的 推 灯 上 的 分 类 效果 尤其 突出 ,但 是 对 于 图 片 位 置 的 推断 略 有 不 足 , 尤其 在 图 片 
的 横向 分 割 和 内 入 式 这 两 种 预测 上 容易 混淆 ， 这 种 情况 占 错误 样 例 的 52%， 这 是 
因为 在 相似 特征 值 的 条 件 下 ， 图 片 位 置 有 多 种 情况 可 以 满足 排版 要 求 。 由 于 以 上 
分 类 器 根据 概率 值 进 行 类 别 的 划分 , 所 以 我 们 会 根据 概率 值 选 择 高 概率 的 图 片 位 
置 参数 值 作为 候选 项 进行 之 后 的 样式 参数 微调 。 

为 了 检验 本 文 方法 对 于 标题 字号 和 栏 数 推断 的 有 效 性 , 我 们 将 测试 数据 中 每 
个 新 闻 版 面 的 全 局 布局 结构 固定 ( 即 与 数据 库 中 历史 版 面 的 全 局 布局 结构 相同 )， 
同时 也 加 入 对 整个 版 面 新 闻 权 重 的 正确 性 判断 。 这 里 我 们 引入 了 均 方 根 误差 
(RMSE) 指标 计算 在 相同 全 局 布局 结构 的 条 件 下 , 本 文 方法 与 其 他 回归 模型 推断 的 
标题 字号 、 栏 数 与 真实 的 标题 字号 、 栏 数 的 差距 。 其 中 , 字号 的 单位 为 毫米 (mm) ， 
字号 权重 的 均 方 根 误差 则 表示 推断 出 来 的 一 个 版 面 标题 字号 大 小 顺序 的 偏差 程 
度 。RMSE 被 定义 为 : 


i> (11) 
n 


其 中 ，v 为 真实 的 变量 大 小 ，y 为 由 本 文 模型 推断 出 来 的 变量 大 小 ，n 为 新 
闻 面 板 总 数 。 表 5 列 出 了 本 文 方法 与 其 它 回归 模型 推断 样式 参数 的 均 方 误差 ,可 
以 看 到 本 文 方法 虽然 在 栏 数 预测 上 略 逊 于 其 他 方法 , 但 在 字号 和 字号 权重 推 关 上 
的 误差 值 是 明显 低 于 其 他 方法 的 , 这 表明 我 们 的 算法 对 面板 字号 进行 了 有 效 的 聚 
类 ， 且 通过 概率 模型 可 以 更 好 的 推断 出 字号 的 大 小 。 同 时 ， 因 为 在 一 些 参数 获取 
上 增加 了 用 户 约束 ， 本 文 方法 也 适用 于 不 同 约束 场景 下 标题 字号 的 求解 ， 由 此 增 
加 了 计算 的 灵活 性 。 


表 5 样式 参数 均 方 根 误差 
栏 数 字号 


mh 
Ian 


方法 


本 文 方法 0. 322 1. 415 0. 144 
最 近邻 0. 531 3. 840 0. 577 
支持 向 量 机 0. 259 2. 981 0. 288 
贝 叶 斯 网 络 0. 430 3. 240 1.021 
在 3.3 节 中 我 们 详细 描述 了 从 高 概率 样式 参数 候选 集合 中 找到 既 满足 布局 
结构 约束 又 满足 美学 设计 原理 的 参数 值 的 模型 , 该 约束 规划 模型 中 的 目标 函数 量 
化 美学 设计 原理 ， 代表 了 样式 微调 的 方向 ， 对 于 目标 函数 的 两 项 微调 因子 的 权重 
我 们 进行 了 进一步 的 探索 。 


是 全 6 全 吕 汉 | 感 全 9 全 吕 汉 | | 本 全 6 全 东汉 | | 晤 全 8 全 虽 汉 
2 新 ao 二 于 | 这 之 和 新 
和 | | 。 = | | | 加 
i 和 村 
CN i -时 i et 
和 (a) 未 经 过 样式 微调 (b) (01,02)=(0,1) (c) (01,02)=(1,0) (d) (01,02)=(10,5) 
> 图 8 目标 函数 中 不 同 微调 因子 权重 (a 1, a 2) 对 应 的 布局 结果 。 (a) 为 未 经 过 样式 微调 的 排 
~ 版 结果 ，(b) 在 样式 微调 中 只 考虑 报 花 图 片 伸缩 变化 幅度 ，(c) 只 考虑 最 小 化 留 白 空 间 ， 而 在 
Ss (d) 中 以 上 两 个 方面 都 得 到 了 考虑 。 
QI 图 8 的 (a) 表示 还 未 进行 样式 微调 时 生成 的 结果 , 整体 版 面 留 白 过 多 。 图 (b)- 
A ER i AD Ee 
GO 结果 。(b) 表示 只 考虑 目标 函数 的 第 二 项 微调 因子 ， 即 获取 使 插入 的 报 花 伸 缩 变 
和 化 幅度 最 小 的 样式 参数 组 合 , 可 以 看 到 该 排版 结果 在 视觉 感官 上 呈现 出 的 层次 性 


较 弱 ， 并 且 右 边 的 报 花 占据 的 视觉 中 心 区 域 过 多 ， 总 的 来 说 ， 在 (b) 权重 下 的 排 
版 质量 偏 低 。 而 (c) 只 考虑 最 小 化 额外 的 留 白 空间 ,虽然 在 内 容 层 次 性 上 看 比 (b) 
表现 好 ， 但 它 却 没有 关注 报 花 图 片 伸缩 变化 程度 带 来 的 排版 质量 的 下 降 。(d) 既 
考虑 了 额外 留 白 空间 又 加 入 了 对 图 片 伸缩 变化 的 惩罚 项 , 可 以 看 到 最 终 的 排版 结 
果 在 不 过 分 伸缩 图 片 的 同时 也 保证 了 样式 微调 的 有 效 组 合 。 
5.2 用 户 调研 评估 

在 本 节 中 我 们 采用 用 户 研 究 来 评估 我 们 的 实验 结果 与 新 手 设 计 师 、 原 版 报纸 
之 间 的 差距 。 对 此 我 们 邀请 了 15 名 有 看 报 习惯 的 研究 人 员 对 这 些 报纸 进行 打分 
在 调查 问卷 设计 中 ,我 们 提供 了 九 张 电子 报 图 片 ， 其 中 三 张 为 使 用 我 们 的 方法 自 
动 生成 , 三 张 为 新 手 设 计 师 生成 , 三 张 为 原版 报纸 , 同时 我 们 设置 了 信息 可 读 性 、 
美观 程度 、 层 次 性 三 个 打分 指标 ， 打 分 程度 分 为 不 满意 、 不 太 满 意 、 一 般 、 较 为 
满意 、 满 意 这 五 种 级 别 〈 这 里 以 分 数 0，5，10，15，20 代替 )。 当 然 ， 为 了 体现 
不 同方 法 生成 电子 报 的 整体 差异 性 ， 我 们 会 提供 相同 的 新 闻 素 材 进 行 生 成 比较 。 
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可 读 性 层次 性 美观 性 
图 9 用 户 调查 统计 结果 
图 9 户 调查 的 最 终 统 计 结 果 ， 可 以 看 到 ， 与 新 手 的 设计 相 比 ， 我 们 的 方法 在 
可 读 性 、 美 观 程度 和 层次 性 上 明显 要 更 加 满足 用 户 的 视觉 感官 需求 ， 且 平均 分 数 
接近 于 “较为 满意 ”这 个 选项 。 虽然 我 们 的 方法 还 无 法 到 达 专 业 的 电子 报 设计 水 
平 ， 但 也 可 以 成 为 设计 人 员 的 一 个 辅助 工具 ， 因 为 在 正常 的 电子 报 排 版 工作 中 ， 
设计 人 员 需 要 结合 客户 的 各 种 需求 、 自身 的 先 验 知识 以 及 美学 思想 等 各 种 主观 性 
的 判断 进行 设计 ， 这 些 因素 是 无 法 正确 估量 的 , 所 以 还 是 要 有 一 个 用 户 交 互 的 过 
程 来 充分 满足 多 样 性 需求 。 
当然 ， 我 们 也 会 根据 同一 新 闻 素 材 为 用 户 提 供 多 种 布局 选择 ， 图 10 显示 了 
同一 新 闻 素 材 通 过 本 文 方 法 生成 不 同 布局 的 电子 报 示例 。 
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图 10 同一 素材 生成 的 多 种 布局 的 电子 报 。 第 一 张 图 片 为 人 工 排 版 的 原版 报纸 ，(a)-(e) 则 


是 由 本 文 方法 在 不 同 布局 结构 下 实现 的 电子 报 自动 生成 结果 。 
6 结论 与 展望 

报纸 的 自动 化 设计 可 以 给 报纸 印刷 行业 带 来 一 种 经 济 、 高 效 且 快捷 的 排版 方 
式 ， 这 对 设计 人 员 也 是 至 关 重 要 的 ， 可 以 减轻 在 考虑 报纸 美观 程度 和 可 读 性 方面 
时 排版 设计 上 的 负担 。 本文 提 出 的 方法 可 以 作为 一 种 辅助 工具 帮助 报纸 排版 人 员 
进行 报纸 的 整体 设计 , 该 方法 利用 概率 模型 和 约束 规划 模型 可 ee. 
版 面 的 样式 参数 。 我们 的 方法 的 限制 是 它 暂 时 只 支持 单 页 电子 报 的 自动 生成 , 然 
而 报纸 排版 多 由 多 个 版 面 组 成 , 在 未 来 的 工作 中 , 我 们 将 考虑 发 展 多 个 版 面 电子 
报 的 自动 化 设计 ， 以 便 支 持 报纸 的 自动 批量 生成 。 
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